Học Máy Cổ Điển
Chào mừng bạn đến với Bài học 6 về Khái niệm Trí tuệ Nhân tạo (COMP5511). Buổi học này đóng vai trò là cầu nối từ nền tảng lý thuyết đến các triển khai thuật toán thực tế. Mặc dù AI hiện đại thường nhấn mạnh vào Học sâu (Deep Learning), Học Máy Cổ Điển vẫn là nền tảng của phân tích dữ liệu. Các thuật toán này mang lại khả năng diễn giải cao và hiệu quả tính toán, làm cho chúng trở thành lựa chọn ưa thích cho dữ liệu có cấu trúc và phân tích tiêu chuẩn công nghiệp.
1. Học có Giám sát
Mô hình này liên quan đến việc huấn luyện một mô hình trên tập dữ liệu có nhãn, nơi thuật toán học mối quan hệ giữa các đặc trưng đầu vào và một đầu ra mục tiêu cụ thể. Điều này cho phép mô hình dự đoán kết quả cho dữ liệu mới, chưa từng thấy một cách chính xác.
- Cây Quyết định: Các mô hình phân chia dữ liệu thành các nhánh để đưa ra quyết định phân loại hoặc số.
- Máy Vector Hỗ trợ (SVM): Các thuật toán tìm siêu phẳng tối ưu để tối đa hóa khoảng cách giữa các lớp dữ liệu khác nhau.
2. Học không Giám sát
Các thuật toán này phân tích dữ liệu không có nhãn để khám phá các mẫu, cấu trúc hoặc nhóm ẩn mà không cần bất kỳ hướng dẫn nào về đầu ra. Các kỹ thuật chính bao gồm:
- Phân cụm K-trung bình: Nhóm các điểm dữ liệu thành K nhóm riêng biệt dựa trên sự tương đồng về đặc trưng.
- Phân tích Thành phần Chính (PCA): Một kỹ thuật giảm chiều dữ liệu được sử dụng để đơn giản hóa dữ liệu phức tạp mà vẫn giữ được phương sai thiết yếu của nó.